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ЕЛЕКТРОНСКИТЕ АЛАТКИ НА ЛИНГВИСТОТ 

АВЅТКАСТ : А 1'еге питегјдие, 1е 1т§шѕ1е пе реиГ раѕ ѕе раѕѕег с1еѕ оиГМѕ 
е1ес1:гоп1риеѕ. Иоиѕ роѕ1и1опѕ ипе с1аѕѕ16са1:1оп с1е сеѕ оиР1ѕ еп с1еих са1е§ог1еѕ : 1. 
ОиГМѕ е1ес1:гоп1риеѕ ѕегауШ: а соНесГег с1еѕ боппееѕ Пп§иЈѕТЈриеѕ е1 2. ОиШѕ 
е1ес1:гоп1риеѕ ѕегуаШ: а соНеДег с1еѕ боппееѕ те1:аМп§шѕ6диеѕ (ои боппееѕ ѕиг 1еѕ 
боппееѕ Мп8и1ѕНриеѕ). Оапѕ 1а ргетЈеге саГеѕогЈе, поиѕ раѕѕопѕ еп геуие 1еѕ 
пауЈѕаГеигѕ, 1еѕ то1еигѕ с1е гесИегсИе е! 1еѕ те!ато1еигѕ, 1еѕ согриѕ МпѕиЈѕНдиеѕ, 1еѕ 
сМсПоппаЈгеѕ е1ес1гопЈдиеѕ е! 1еѕ сМсНоппаЈгеѕ ујѕие1ѕ атѕј рие 1еѕ то1еигѕ с1е 
гесИегсИе с1е бигеаи. Оапѕ 1а беихЈете саГеѕогЈе, поиѕ е1а6Мѕѕопѕ с1е поиуеаи ипе 
сМу 1 Ѕ 10 п еп с1еих с1аѕѕеѕ : 1. ОиШѕ е1ес!:гоп1диеѕ ѕегуап!: а соМесГег с1еѕ боппееѕ 
теГаМпѕиЈѕНриеѕ §епега1еѕ е! 2. ОиГМѕ МпѕиЈѕНриеѕ ѕегуап! а соМес!ег с1еѕ боппееѕ 
теГаМпѕиЈѕНриеѕ рагНсиМегеѕ. Аи боиГ с1е сеПе апа1уѕе, поиѕ сопс1иопѕ ди'ипе 
гесИегсИе МпѕиЈѕНдие е1ес1гогМрие роѕѕебе, раг гарроП: а 1а гесИегсИе МпѕиЈѕНрие 
с1аѕѕјрие, сеПатѕ а!ои!ѕ тс1еп1а61еѕ : еМе еѕ1 р1иѕ гарјс1е, р1иѕ ехИаиѕГУе, р1иѕ ргесЈѕе, 
р1иѕ уегЖа61е, тотѕ сИеге е! р1иѕ ассеѕѕПз1е. 

Мо1ѕ-с1еѕ : гесИегсИе МпеиЈѕНрие, боппееѕ Мп§и1ѕНдиеѕ е1 теГаМпѕшѕНриеѕ, оиН1ѕ 
е1ес1гопЈриеѕ (пау|§а1еигѕ, то!еигѕ с1е гесИегсИе, согриѕ МпѕиЈѕНриеѕ, 
сМсНоппа1геѕ е1ес1готриеѕ, агсИЈуеѕ МпѕиЈѕНриеѕ) 

Лингвистиката не престанува да го проучува говорот и јазиците кои 
се зборуваат/зборувале на сите четири страни на светот. Она што го раз- 
ликува денешниот лингвист во однос на лингвистот од времето пред поја- 
вата на компјутерите и особено на интернетот е употребата на електрон- 
скиот дигитален запис. Можноста да се запишат во електронски дигитален 
код текстуалните, звучните и визуелните податоци претставува значајна 
алка во развојниот пат на комуникацијата меѓу луѓето која може да се 
спореди со појавата на писмото или пак со појавата на печатницата. Инфор- 
мациските и комуникациските технологии имаат големо влијание врз сите 
сфери од човековото живеење, а ние ќе се задржиме само на нивната улога 
во лингвистичките истражувања. 

Во нашиот труд ќе се обидеме да ги опфатиме главните електронски 
алатки коишто му стојат на располагање на лингвистот. Основните наши 
поставки во врска со улогата на електронските алатки во лингвистичките 
истражувања се следните: 1. електронски-потпомогнатото лингвистичко 
истражување (понатаму: електронското лингвистичко истражување) е 
побрзо 2. електронското лингвистичко истражување е поопфатно 3. 
електронското лингвистичко истражување е попрецизно 4. електронското 
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лингвистичко истражување е попроверливо 5. електронското лингвисти- 
чко истражување е поевтино и 6. електронското лингвистичко истражува- 

ње е попристапно. 

Вториот термин од на пт иот наслов "алатка" е двозначен и соодвет- 
ствува на развојот на компјутерите. Ако компјутерот е алатка која има за 
намена автоматски да пресметува, таа своја функција ја извршува со помош 
на неопходните два составни дела: хардверот и софтверот. И лингвистот не 
може да врши електронско истражување без хардвер и без софтвер. 

Основниот хардвер без кој нема електронско лингвистичко истра- 
жување зависи од потребите на лингвистот, лични или институциски, но 
приближно би можеле да го претставиме на следниот начин: мултимеди- 
јален персонален компјутер со пристап до брз интернет, со доволно брз по- 
веќејадрен процесор со повеќе периферни уреди: мемориски уреди (РАМ 
меморија, дисковни единици (механички диск, електронски диск, 1ЈЅВ ме- 
морија, мемориски картички), влезни периферни единици (тастатура, глув- 
че, скенер, микрофон, веб камера, телевизиска картичка/земјена или сате- 
литска/) и излезни единици (графичка карта, екран, звучна карта, звучници, 
печатач, модем, рутер). Главната компонента на компјутерот, микропро- 
цесорот, има најважна улога во брзината на компјутерот, но и секој друг 
помошен уред има дополнителна улога во побрзата обработка на разните 
видови податоци. Основните познавања за хардверскиот дел на компјуте- 
рот се потребни за подобро конфигурирање на компјутерот и за негово пое- 
фикасно искористување. Доколку се работи за некои поспецифични лин- 
гвистички истражувања (фонетски, дијалектолошки и други) потребни се, 
се разбира, и други специјализирани алатки. 

Второто значење на зборот "алатка" не упатува на софтверскиот дел 
на компјутерот преку кој всушност и се материјализира улогата на 
помошно средство во лингвистичките истражувања. 

Лингвистот работи со јазичните и говорните форми кои се јавуваат 
во пишана или звучна форма. Значи, се она што претставува јазична или 
говорна единица и што се сретнува во електронска форма (на интернет, на 
мемориски носачи /разни видови дискови; ЦД-а, ДВД-а, УСБ мемории, 
разни тврди дискови/, телевизија) може да му користи на лингвистот. Се 
разбира тоа се сирови податоци што лингвистот треба да ги обработи во 
своето проучување. Денес, интернетот му овозможува на лингвистот да има 
достап до неизмерен број на податоци кои можат да му служат во неговите 
истражувања. Во основа, сите тие податоци можеме да ги групираме во две 
категории: 1. податоци од или на јазикот и 2. податоци за јазикот. И двата 
вида се опишуваат со една единствена придавка во западноевропските 
јазици: анг. "1ш§шѕ1ѓс", додека во македонскиот јазик за првиот вид на 
податоци го користиме терминот "јазични", додека за вториот вид податоци 
постои терминот "лингвистички". Оваа поделба ќе ја користиме како 
основа за претставување на електронските алатки на лингвистот. Треба да 
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нагласиме дека честопати и двата вида на податоци можат да се најдат на 
исто место, доколку се работи за структурирани и обработени јазични 
податоци како што ќе видиме подолу. Би сакале да наведеме уште едно 
објаснување: во нашето излагање се осврнуваме на алатките кои се корис- 
тат во оперативниот систем "\Ушс1о\уѕ", иако во најголем дел сите тие алат- 
ки се повеќеплатформски и се сретнуваат и во други оперативни системи. 

I. ЕЛЕКТРОНСКИ АЛАТКИ ЗА СОБИРАЊЕ ЈАЗИЧНИ ПО- 
ДАТОЦИ 

Сметаме дека собирањето податоци претставува предуслов за секое 
научно истражување, зашто истражувачот ги проучува податоците во врска 
со некоја појава за да утврди одредени ставови или тези со кои се опишува 
и/или објаснува дадената појава. 

Основни алатки преку кои се обавува собирањето јазични податоци 
од интернет претставуваат најпрвин прегледувачите (анг. Бго\уѕегѕ). Меѓу 
бројните прегледувачи кои постојат се издвојуваат неколку: 1гДегпе1: Ех- 
р!огег (<1шр://\\1П(Јо\\'ѕ.т1сгоѕо1'Гсот/сп-иѕ/1тстс1:-схр1огсг/1е- 1 0-\\’огк1\\м- 
бе-1ап§иа§еѕ>), МогШа Еѓгеѓох (<11Пр://\\'\\ , \\'.то7Ј11а.о1'«/с11-1ЈЅ/1и'е1ох/а11/>Ј, 
СБготе (< ППрѕ://\у\у\у.еооа1е.сот/т11/еп/с11готе/Бго\уѕег/ >), Орега ( ПНр://- 
сп.ѕо11опЈс.сот/ѕ/1гсс-с1о\\'п1оас1-орсга/сп»1Јѕ11 >), Ѕаѓагѓ (<1аПр://ѕиррог1.арр1е- 
.сот/кБ/Ш1531>). Се разбира, секој од нив има свои подобри и полоши 
страни така што препорачливо е самиот лингвист да испроба повеќе прег- 
ледувачи за да може да избере еден или два што ќе ги користи секојдневно. 
Кога би можело да се искомбинира еден кој ќе ги содржи најдобрите 
карактеристики на секој од наведените прегледувачи како и од некои други: 
МахШоп (< 11Ир://тахШоп.сп.ѕо1ЈопЈс.сот />), А\апГ В го\уѕег (< ПИр://\у\у\у.- 
ауапШго\уѕег.сот/с1о\уп1оас1.аѕрх >), СгеепВго\уѕег (<ПНр://§геепБго\уѕег.- 
еп.ѕоНошс.сот/>) и др. би било најдобро, но, за жал, тоа не е можно. Како 
и да е, денес прегледувачите си личат поприлично еден на друг затоа што 
се натпреваруваат да вклучат одредени карактеристики кои се среќаваат кај 
други прегледувачи. 

Она што е многу важно за прегледувачите се дополнителните 
програми (асМопѕ, р1и§-тѕ) кои ги подобруваат нивните функции и чес- 
топати додаваат одредени икони или ленти во самиот прегледувач. Потре- 
бно е значи да се инсталираат одредени екстензии за да може подобро да се 
прегледуваат одредени видови на фајлови (рсШ, ЛаѕИ, видео, звучни, с-Ноок 
фајлови и др.) Сите наведени прегледувачи може да се сретнат во различни 
јазични верзии а кај некои од нив постои и македонска верзија. 

Прегледувачот сам по себе овозможува да се дојде до одредена веб 
страница доколку се знае нејзината адреса. Изнаоѓањето на страници со 
нивните адреси е токму задача на пребарувачите (анг. ѕсагсН еп§теѕ) кои 
се неизбежна алатка за пронаоѓање на информации па според тоа и на 
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јазични податоци неопходни за лингвистичките истражувања. Денес, нај- 
познат и најмногу користен пребарувач е ОооДс ( < И п рѕ : //\у \\'\\ ; . §оо§1е . - 
сот>. Секако постојат и други пребарувачи меѓу кои Втѕ (< Нир://\у\у\у.- 
НЈпѕ.сот/ >), УаНоо (< НИр://\у\у\у.уаНоо.сот/ >), Аѕк.сот ( < И Н р : //\у \у \у . а ѕ к . - 
сот/>), Иусоѕ (< НИр://\у\у\у.1усоѕ.сот/ >). На теренот на источна Азија доста 
се користи и кинескиот пребарувач Вајби ( < И Н р : /А у \у \у . Н а ј И и . с о т/ >) . Една 
општа забелешка за сите пребарувачи е дека бројот на страници кои се 
пронајдени од страна на пребарувачот е само виртуелна бројка (при некои 
пребарувања резултатот е бројка од неколку милијарди '). Најголемиот број 
на страници што ги покажува и кои пт то може да се отворат е околу 800, а 
во најголем број на случаи се движи на нешто повеќе од 500. Сите 
пребарувачи користат одредена синтакса, одреден број на оператори, 
регуларни изрази а имаат и други особини (да пребаруваат разни формати 
на фајлови, да пребаруваат само во одреден дел од страницата, да 
пребаруваат само одреден сајт или пак страници кои упатуваат на тој сајт, 
да пребаруваат страници во ограничен временски период и др.). Кога ќе се 
пронајде страницата која го содржи бараниот израз, тогаш во самиот 
прегледувач постои можност да се обележат со посебна боја сите појаву- 
вања на тој израз во даден текст. На тој начин можеме да видиме во колкав 
број и во кои контексти се јавува дадениот израз. 

Треба да се спомене дека постојат и програми кои нудат исто- 
времено пребарување преку повеќе пребарувачи. Таквите програми се на- 
рекуваат метапребарувачи: Ме1асга\у1ег (< кЦр://\у\у\у.те(асга\у1ег.сот />), 
\Уе1)сга\у1ег (<1зЦр://\у\у\у.\уе1)сга\у1ег.сот/>) и др. 

Во македонската средина интересни се сервисите на медиските 
агрегатори (анг. шесИа а§§ге§а(огѕ) РаПу.тк (< ЦЦр://баЈ1у.тк/ >) и Тѓте.- 
тк (< ЦЦр://\у\у\у.Цте.тк/ >) овој последниов содржи и англиско-македон- 
ско-англиски речник и архива) кои овозможуваат пребарување на интер- 
нетските страници на голем дел од македонските печатени и електронски 
медиуми. 

Треба да се спомене и корисниот сервис СјоојНс ТЧјптпд Уѓе\уег 
( < 1гЦр :/Љоокѕ. ѕоо ѕ!е ,со 1 и/пѕгатѕ >) кој овозможува да се пребарува фрек- 
венцијата на појавување на одреден збор или група зборови во електрон- 
ските текстови на Ооо§1е Воокѕ и притоа да се избере временскиот период. 
Ова е корисна можност за историски лексиколошки истражувања, особено 
што може да се добијат графикони кои содржат повеќе барани ајтеми одед- 
наш. 

Главното прашање што треба да си го постави лингвистот при некое 
истражување, покрај теорискиот лингвистички модел се разбира, е пред- 



1 Најголем број на страници индексирани од страна на пребарувачот Гугл 
упатуваат на ознаката "бир", вкупно 25.270.000.000. 
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